首页> 外文OA文献 >Improving text segmentation using latent semantic analysis: A reanalysis of Choi, Wiemer-Hastings, and Moore (2001)
【2h】

Improving text segmentation using latent semantic analysis: A reanalysis of Choi, Wiemer-Hastings, and Moore (2001)

机译:使用潜在语义分析改善文本分割:Choi,Wiemer-Hastings和Moore(2001)的再分析

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。
获取外文期刊封面目录资料

摘要

Choi, Wiemer-Hastings, and Moore (2001) proposed to use Latent Semantic Analysis (LSA) to extract semantic knowledge from corpora in order to improve the accuracy of a text segmentation algorithm. By comparing the accuracy of the very same algorithm, depending on whether or not it takes into account complementary semantic knowledge, they were able to show the benefit derived from such knowledge. In their experiments, semantic knowledge was, however, acquired from a corpus containing the texts to be segmented in the test phase. If this hyper-specificity of the LSA corpus explains the largest part of the benefit, one may wonder if it is possible to use LSA to acquire generic semantic knowledge that can be used to segment new texts. The two experiments reported here show that the presence of the test materials in the LSA corpus has an important effect, but also that the generic semantic knowledge derived from large corpora clearly improves the segmentation accuracy.
机译:Choi,Wiemer-Hastings和Moore(2001)提出使用潜在语义分析(LSA)从语料库中提取语义知识,以提高文本分割算法的准确性。通过比较完全相同的算法的准确性,取决于是否考虑了互补语义知识,他们能够显示出从此类知识中获得的收益。然而,在他们的实验中,语义知识是从包含测试阶段要分割的文本的语料库中获得的。如果LSA语料库的这种超特殊性解释了最大的好处,那么您可能会想知道是否有可能使用LSA来获取可用于分割新文本的通用语义知识。此处报告的两个实验表明,LSA语料库中测试材料的存在具有重要作用,而且从大型语料库中获得的通用语义知识也明显提高了分割精度。

著录项

  • 作者

    Bestgen, Yves;

  • 作者单位
  • 年度 2006
  • 总页数
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号